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Beschreibung 

Auswahl der Benutzersprache an einem rein akustisch 
gesteuerten Telefon 

Bei Kommunikations- und Inf ormationsgeraten werden textuelle 
Informationen in der durch die Landerversion vorgegebenen 
Sprache dargestellt. Damit einhergehend gibt es fur den 
Benutzer die MQglichkeit, die gewunschte Sprache als 
Benutzersprache oder Bediensprache einzustellen. Wenn jetzt - 
aus welchem Grund auch immer - die Sprache der 
Benutzeroberflache verstellt ist, steht der Benutzer vor dem 
Problem, die gewttnschte Benutzersprache wieder einzustellen, 
ohne dass er zu dem betref fenden Mentieintrag oder 
Steuerungszustand durch textuelle Rackmeldungen gefuhrt 
werden kann. 

Dieses Problem besteht allgemein und ist nicht auf graf ische 
Benutzeroberflache mit Tastatur- oder Mauseingabe beschrankt. 
Im Gegenteil wird es in Zukunft mehr und mehr Endgerate 
geben, die rein akustisch bedient werden. Auch bei Call- 
Centern, bei denen ebenfalls eine rein akustische Bedienung 
vorgenommen wird, stellt sich das Problem. Dabei erfolgt die 
Spracheingabe tiber Spracherkennung und die Sprachausgabe 
entweder durch Abspielen vorgef ertigter Sprachkons erven oder 
durch automatisierte Sprachsyn these in Form einer Text-zu- 
Sprache-Umwandlung . 

Bei Geraten mit Bildschirm- bzw. Display- und Tastatureingabe 
findet man zur L6sung des darges tell ten Problems folgende 
Vorgehensweise: Im Allgemeinen gibt es die MSglichkeit, das 
Gerat auf die werkseitig vorhandene Spracheinstellung 
zuriickzusetzen. Dies erfolgt meist durch eine bestimmte 
Tastenkombination. Ebenso gibt es Gerate, bei denen sich auf 
einfache Weise ein Sprachmenu aktivieren lasst, indem der 
Benutzer die Zielsprache auswahl en kann. Das sieht dann etwa 
wie folgt aus: 
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Deutscli 

Franc ais 

English 

YKpalHeut 

(Ukrainisch) 
Romanes c 

(Rumanisch) 



Tabelle 1 

in diesem Menu kann der Benutzer nun die gewiinschte und damit 
einzustellende Benutzersprache auswahlen. Eine solche 
Vorgehensweise ist fur rein akustisch gesteuerte Gerate 
naturlich nicht m6glich. 

Davon ausgehend liegt der Erfindung die Aufgabe zugrunde, die 
Auswahl der Benutzersprache einer Vorrichtung mittels eines 
rein akustischen Verfahrens zu ermoglichen. Die 
Auswahlmoglichkeit soil auch gerade dann zur Verfugung 
stehen, wenn die Vorrichtung keine Unterstutzung durch eine 
Anzeige leisten kann oder soil . 

Diese Aufgabe wird durch die in den unabhangigen Ansprtichen 
angegebenen Erfindungen gelSst . Vorteilhafte Ausgestaltungen 
ergeben sich aus den Unteranspruchen . Durch die Erfindung 
kann die einzustellende Benutzersprache einer Vorrichtung 
einfach dadurch eingestellt werden, dass zur Auswahl der 
Benutzersprache einfach die einzustellende Benutzersprache 
gesprochen wird. Ein Englander sagt also: "English", ein 
Deutscher sagt einfach "Deutsch" , ein Franzose sagt 
"Frangais" und ein Ukrainer sagt "Ukrajins'kyj " (englische 
Transliteration von "ukrainisch" in polnischer Schrift) . 

Die Realisierung dieser Funktionalitat in den 
Spracherkennungsmitteln der Vorrichtung ist keineswegs 
trivial, weshalb im Folgenden bevorzugte M6glichkeiten 
genauer dargestellt werden sollen. 
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Eine Moglichkeit besteht darin, einen Einzelworterkenner auf 
die zu erkennenden Bezeichnungen der einstellbaren 
Benutzersprachen zu trainieren. Da die hier verwendeten 
Algorithmen zumeist auf blofcem Mustervergleich basieren, 
benStigt man ftir das Training eine ausreichende Anzahl von 
Sprachkonserven, in denen die Sprache (als Wort) von 
muttersprachlichen Sprechern zu der entsprechenden Sprache 
(als Code) aufgesprochen ist. Hierbei kann insbesondere ein 
Dynamic -Time- Warp ( ,,DTW n ) -Erkenner zu Einsatz kommen. 

Sollte die Vorrichtung, etwa ftir andere Funktionalitaten, 
bereits tiber eine phonembasierte Spracherkennung verftigen, sc 
ist es vorteilhaft, diese ftir das Einstellen der 
Benutzersprache heranzuziehen. Dazu ergeben sich drei 
M6glichkeiten. 

So kann in den Spracherkennungsmitteln ein multilinguales 
Hidden-Markov-Modell ( „HMM U ) zur Anwendung kommen, das die 
Phoneme aller Sprachen modelliert. Hierfur ist eine 
standardisierte Darstellung eines phonetischen Alphabets 
besonders vorteilhaft, etwa in der Form von SAMPA-Phonemen. 

So uberzeugend dieser Ansatz ftir die geschilderte 
Problemstellung ist, zeigen sich doch in der Praxis 
multilinguale Spracherkennungsmittel bezuglich der 
Erkennungsrate einer sprachspezif ischen Modellierung 
unterlegen. Fur die normale Spracherkennung in der 
Vorrichtung wurde also noch ein weiteres akustisches Modell 
benotigt, welches weiteren Speicherplatz verbrauchte. 

Deshalb erweist sich eine andere Moglichkeit als vorteilhaft, 
bei der die zu den Bezeichnungen der einstellbaren 
Benutzersprachen gehorigen Phonemsequenzen aus den HMMs ftir 
die unterschiedlichen Sprachen kombiniert sind. Hierbei muss 
allerdings bedacht werden, dass die Ubereinstimmungsmafie, die 
die Spracherkennung far die in unterschiedlichen 
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Phoneminventaren model liert en WSrter liefert, nicht direkt 
miteinander vergleichbar sind. Dieses Problem kann umgangen 
werden, wenn im kombinierten HMM die tjbereinstimmungsmaSe fur 
die Phonemsequenzen aus den unterschiedlichen erkennbaren 
5 Benutzersprachen skaliert sind. 



Eine besonders geschickte MSglichkeit ergibt sich, wenn man 
statt eines multilingualen HMMs oder der Kombination von 
Phonemsequenzen mehrerer sprachspezif ischer HMMs nur ein 

10 einziges sprachspezif iscbes bzw. landerspezif isches HMM 
verwendet und dabei die Bezeichnungen der fremden 
Benutzersprachen mit dem sprachspezif ischen Phonemsatz 
modelliert. Zur Erlauterung dient das folgende Beispiel fiir 
die deutsche Sprache, das dem Menu in Tabelle 1 nachempfunden 

15 ist. Die Wortmodelle sind in "phonet ischer" Schreibweise : 



/ 


a 


eu t sh / 


/ 


f 


r o ng s ae / 


/ 


i 


ng 1 i sh / 


/ 


u 


k r ai n sk i j / 


/ 


r 


o m a n e sh t sh / 



Tabelle 2 



Hier entfallt die Notwendigkeit, ein multilinguales HMM zu 
20 verwenden oder Phonemsequenzen mit unterschiedlichen 




Phoneminventaren bei der Erkennung zu kombinieren. 

Gemafi der einleitenden Problems tel lung ist die Vorrichtung 
insbesondere ein mobiles Endgerat in Form eines Mobil- oder 
25 Schnurlostelefons, ein Headset oder der Server eines Call- 
Centers . 

Bevorzugte Ausgestaltungen des erf indungsgemaSen Verfahrens 
ergeben sich analog zu den dargestellten bevorzugten 
30 Ausgestaltungen der erf indungsgemaSen Vorrichtung. 
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Weitere wesentliche Merkmale und Vorteile der Erfindung 
ergeben sich aus der Beschreibung eines Ausftihrungsbeispiels 
anhand der Zeichnung. Dabei zeigt: 

Figur 1 den Ablauf bei der Einstellung der Benutzersprache. 

Die Vorrichtung kann in Form eines schnurlosen Headsets 
verwirklicht sein, das ausschlieSlich iiber Sprache gesteuert 
wird. Dies kann beispielsweise ein Headset sein, das tiber 
Bluetooth, Dect, GSM, UMTS, GAP oder einen anderen 
Ubertragungsstandard mit oder onne Kabel eine Verbindung zu 
einer Basis aufnimmt. 

Das Headset weist eine 0n-/0ff -Taste sowie eine so genannte 
"P2T-Taste" ("push-to-talk") auf, mit der der Audiokanal fur 
ein bestimmtes Zeitfenster auf die Spracherkennungsmittel 
geschaltet wird. Die Kommandosteuerung des Headsets 
beinhaltet das kurze Driicken der P2T-Taste, ein Quittieren 
des Tastendrucks durch einen kurzen Piep-Ton und das 
anschliefiende Sprechen des gewunschten Kommandos, worauf die 
Vorrichtung entsprechend reagiert. 

Beim ersten Einschalten der Vorrichtung (Schritt 1) bzw. nach 
einem Zuriicksetzen der Vorrichtung (Schritt 2), was 
beispielsweise durch ein langeres Driicken auf die P2T-Taste 
hervorgerufen wird, befindet sich der Benutzer zunSchst in 
der Benutzersprachauswahl . Dies wird dem Benutzer durch ein 
akustisches Signal (Schritt 3) mitgeteilt, das beispielsweise 
in einem langeren Piep-Ton oder einer mehrsprachigen 
Aufforderung zum Einsprechen der einzustellenden 
Benutzersprache besteht . 

Der Benutzer spricht nun die Bezeichnung der einzustellenden 
Sprache in der einzustellenden Sprache in die Vorrichtung ein 
(Schritt 4) . Die Spracherkennungsmittel der Vorrichtung 
erkennen nun die in der einzustellenden Benutzersprache 
gesprochene Bezeichnung der einzustellenden Benutzersprache, 
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soweit es sich bei der einzustellenden Benutzersprache um 
eine der mehreren einstellbaren Benutzersprachen der 
Vorrichtung handelt. Daraufhin stellen die 
Benutzerspracheneinstellungsmittel der Vorrichtung die 
Benutzersprache der Vorrichtung auf die von den 
Spracherkennungsmitteln erkannte Benutzersprache ein, wodurch 
die Vorrichtung entsprechend initialisiert wird. AnschlieSend 
kann mit der Vorrichtung gearbeitet werden (Schritt 6), als 
ob sie normal eingeschaltet wurde (Schritt 5) . 

Bei der Korrektur von Spracherkennungs- und Bedienf ehlern 
kann auf bewahrte Mittel und Verfahren aus dem Stand der 
Technik zurttckgegrif f en werden. 

15 Allen Ausfiihrungsformen der Erfindung ist der herausragende 
Vorteil einer deutlichen Vereinf achung und Verkurzung der 
Bedienung der Vorrichtung gemeinsam. Weiterhin gibt es , 
sofern eine phonembasierte Erkennung verwendet wird, nicht 
die Notwendigkeit, Sprachkons erven in der Vorrichtung 

20 abzulegen. Die Tatsache, dass bereits phonembasierte 

akustische Ressourcen in der Vorrichtung vorhanden sind, wird 
dabei optimal ausgenutzt. 
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Patentanspruche 
1. Vorrichtung mit 

- Spracherkennungsmitteln zum Erkennen einer in einer 
einzustellenden Benutzersprache gesprochenen Bezeichnung der 
einzustellenden Benutzersprache der Vorrichtung, 

wobei mehrere einstellbare Benutzersprachen der Vorrichtung 
durch die Spracherkennungsmittel erkennbar sind, indem die 
Bezeichnung der jeweils einzustellenden Benutzersprache in 
der einzustellenden Benutzersprache gesprochen wird, 

- Benutzerspracheneinstellungsmitteln zum Einstellen der 
Benutzersprache der Vorrichtung auf die von den 
Spracherkennungsmitteln erkannte Benutzersprache. 

2 . Vorrichtung nach Anspruch 1 , 
dadurch g e k e n n z e i c h n e t , 

dass die Spracherkennungsmittel einen Einzelworterkenner 
aufweisen. 

3 . Vorrichtung nach Anspruch 1 , 
dadurch gekennzeichnet, 

dass die Spracherkennungsmittel einen phonembasierten 
Erkenner aufweisen. 

4 . Vorrichtung nach Anspruch 3 , 
gekennzeichnet durch 

ein multilinguales Hidden-Markov-Model 1 , das von den 
Spracherkennungsmitteln verwendbar ist. 

5 . Vorrichtung nach Anspruch 3 , 
gekennzeichnet durch 

ein kombiniertes Hidden-Markov-Model 1, das Phonemsequenzen 
aus den mehreren erkennbaren Benutzersprachen enthalt und von 
den Spracherkennungsmitteln verwendbar ist. 



6. Vorrichtung nach Anspruch 5, 
dadurch gekennzeichnet, 
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dass im kombinierten Hidden-Markov-Model 1 die 

ubereinstimmungsmaSe far die Phonemsequenzen aus den mehreren 
erkennbaren Bediensprachen skaliert sind. 

7 . Vorrichtung nach Anspruch 3 , 
g e k e n n z e i c hn e t durch 

ein sprachspezifisch.es Hidden-Markov-Model 1 , bei dem die 
Phoneme fur die Bezeichnungen der mehreren erkennbaren 
Benutzersprachen mit dem sprachspezif ischen Phonemsatz des 
sprachspezifischen Hidden-Markov-Modells modelliert sind. 

8. Vorrichtung nach einem der vorhergehenden Anspruche, 
dadurch g e k e n n z e i c h n e t , 

dass die Vorrichtung ein mobiles Endgerat ist. 

9. Vorrichtung nach einem der vorhergehenden Anspruche, 
dadurch g e k e n n z e i c h n e t , 

dass die Vorrichtung Mittel zur Ausgabe einer Aufforderung 
zum Einsprechen der Bezeichnung der einzustellenden 
Benutzersprache aufweist. 

10. Verfahren zum Einstellen einer Benutzersprache einer 
Vorrichtung, 

- bei dem mehrere einstellbare Benutzersprachen durch eine 
Spracherkennung erkennbar sind, wenn die Bezeichnung der 
jeweils einzustellenden Benutzersprache in der 
einzustellenden Benutzersprache gesprochen wird, 

- bei dem die in der einzustellenden Benutzersprache 
gesprochene Bezeichnung der einzustellenden Benutzersprache 
erkannt wird, 

- bei dem die erkannte einzustellende Benutzersprache als 
Benutzersprache der Vorrichtung eingestellt wird. 
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Zusammenfassung 

Auswahl der Benutzersprache an einem rein akustisch 
gesteuerten Telefon 

Die Benutzersprache einer Vorrichtung kann durch Einsprechen 
der Bezeichnung der einzustellenden Benutzersprache in der 
einzustellenden Benutzersprache eingestellt werden. 
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Fig. 1 
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